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地 铁 列车 环境 中 多 依赖 复杂 事件 处 理 研究 
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摘 要 : 针对 多 源 海量 实时 数据 的 复杂 事件 检测 中 ， 原 始 事件 流 的 分 流 处 理 存在 事件 检测 准确 率 低 及 效率 慢 的 问题 ， 
提出 一 种 基于 事件 树 的 复杂 事件 检测 方法 。 首 先 给 出 事件 依赖 关系 的 明确 定义 ， 然 后 根据 原子 事件 间 和 存在 的 多 依赖 关 
系 生成 原子 事件 树 ， 以 事件 树 为 节点 构造 依赖 事件 树 链表 ， 提 升 复杂 事件 处 理 引 擎 的 有 效 检测 次 数 ， 使 得 事件 检测 的 
匹配 效率 得 到 提升 。 同 时 该 方法 减少 了 事件 检测 过 程 的 内 存 消耗 ， 提 高 了 事件 检测 的 吞吐 量 。 仿 真实 验 与 案例 研究 证 
明了 提出 方法 在 海量 数据 处 理 上 的 优异 性 及 可 行 性 。 
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Study on multi-dependency complex event processing in subway train environment 
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Abstract: For complex event detection in the mass real-time data from multiple sources, there is a problem of low accuracy and 
inefficiency in the triage of original event streams. This paper proposed a method of complex event detection based on an event 
tree. Firstly, defining dependencies between events, then take full account of the multi-dependencies between atomic events to 
generate atomic event trees and form the list with the dependent event trees, increasing the number of effective detection of 
complex event processing engines, such that the matching efficiency of event detection is improved. Meanwhile, this method 
reduces the memory consumption and improves the throughput of event detection. Simulation experiments and case studies 


demonstrate the advantages and feasibility of this method on massive data processing. 
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顺序 地 执行 匹配 规则 ， 比 如 下 列 四 种 经 典 的 CEP 检测 方法 : 基 
于 自动 机 复杂 事件 检测 方法 中 , 基于 Petri 网 复杂 事件 检测 方法 
在 地 铁 列车 的 运行 环境 中 ， 大 量 感 知 设备 用 于 监控 列车 的 14， 基于 匹配 树 复杂 事件 检测 方法 外 和 基于 有 向 图 复杂 事件 检 
运行 过 程 中 的 环境 因素 、 设 备 性 能 、 状 态 变化 等 等 ， 从 而 产生 ，” 测 方 法 四。 但 在 面临 地 铁 列 车 产生 的 实时 多 源 且 存在 依赖 关系 
了 海量 关系 复杂 的 原始 数据 流 。 事 件 的 处 理 对 于 从 原始 数据 流 ”的 原子 事件 流 时 ，CEP 引擎 以 集中 串 行 顺序 的 处 理 方式 是 不 能 
中 发 现 知 识 是 至 关 重 要 的 由， 复杂 事件 处 理 〈complex event 满足 上 层 应 用 的 需求 的 。 在 这 种 情形 下 ， 越 来 越 多 的 研究 开始 


0 引言 


processing， CEP) 作为 一 种 新 兴 的 基于 事件 流 的 技术 , 通常 。 关注 于 复杂 事件 的 分 流 处 理 问 题 。 

在 特定 的 上 下 文 环境 下 ， 从 异 构 事件 源 的 原子 事件 中 检测 出 存 如 Schultz-Moller 等 人 提出 一 种 在 集群 上 的 多 个 节点 上 

在 业务 价值 的 复杂 事件 模式 ， 进 而 实现 自动 化 的 解决 方案 或 警 ” 分 配 查 询 处 理 的 方法 ， 在 吞吐 量 方面 提高 了 系统 的 性 能 ， 但 是 

报 机 制 等 。 该 方法 是 通过 将 多 源 事件 传输 到 中 央 节 点 后 路 由 到 处 理 节 点 ， 
CEP 本 质 是 从 匹配 识别 事件 的 规则 中 选取 并 执行 规则 , 所 方法 的 优化 只 在 中 央 节 点 上 进行 ， 处 理 节点 的 检测 效率 较 低 ， 


以 现 有 的 CEP 处 理 大 多 是 将 多 个 异 构 数据 源 的 事件 流 合并 后 。 同时 路 由 的 通信 成 本 较 高 。Akdere 等 人 四 提出 一 种 复杂 事件 检 
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录用 稿 乔 雅 正 ， 等 : 地 铁 列 车 环境 中 多 依赖 


测 的 协调 器 来 拉 取 和 推送 事件 进行 分 析 ， 通 过 对 FSM 状态 重 件 源 间 的 不 同类 别 之 间 的 分 类 关系 , 如 RFID 读 写 器 、 无 线 传 感 

新 排序 或 重 写 来 标记 分 发 ， 有 效 降低 通信 成 本 与 检测 延迟 ,但 器、 网 络 监控 设备 、 活 动 数 据 库 等 产生 的 原始 数据 等 。 非 分 类 

是 该 方法 的 时 间 复 条 度 是 指数 级 ， 仅 适用 于 小 规模 事件 检测 。 关系 反映 的 是 事件 在 时 间 顺 序 关 系 上 的 深层 次 的 语义 关系 ， 如 

Chen 等 人 四 设计 了 14 种 复杂 事件 处 理 操作 符 ， 给 出 了 基于 操 ” 关联 关系 ， 分 类 关系 ， 聚 类 关系 等 。 

作 符 的 事件 负载 分 流 方法 ， 相 比 于 集中 串 行 顺序 的 检测 速度 有 ”1.2 地铁 运 行 环境 中 的 事件 分 类 

很 大 程度 的 提升 ， 但 在 面 对 地 铁 列 车 的 环境 ， 不 考虑 事件 间 的 目前 ， 以 广州 地 铁 为 例 ， 其 运营 总 长 度 有 400KM， 在 复杂 

依赖 关系 , 该 方 法 的 检测 效率 不 足以 满足 需求 。 针 对 以 上 问题 ， 多 变 的 地 铁 运 行 环 境 中 为 了 保持 地 铁 列 车 的 持久 安全 运行 ， 需 

本 文 将 研究 一 种 高 效率 , 高 吞吐 , 低 内 存 的 复杂 事件 检测 方法 。 要 对 列车 运行 的 环境 实时 掌控 ， 面 向 列车 运行 环境 中 的 海量 数 
针对 地 铁 列 车 环境 中 海量 多 依赖 事件 流 的 高 效 实时 检 闹 据 多 源 动 态 数据 流 复杂 事件 高 效 检测 机 制 实现 了 对 数据 的 实时 

技术 是 保证 列车 正常 安全 运行 的 关键 技术 。 因 上 智能 处 理 ”。 

在 列车 的 运行 环境 诸多 因素 中 , 本 文 将 环境 中 的 感知 对 象 

的 多 依赖 关系 及 地 铁 环境 中 的 事件 分 类 ， 以 原子 事 分 为 固定 对 象 、 移 动 对 象 、 环 境 对 象 。 根 据 感知 对 象 的 特征 ， 

件 树 为 节点 构造 存在 多 依赖 关系 的 事件 树 链表 ， 减 少 事件 检 洲 我 们 将 其 分 解 为 微观 、 中 观 和 宏观 三 个 层面 ， 如 表 1 所 示 。 

过 程 中 的 元 余 检 测 ， 从 而 提高 复杂 事件 检测 效率 。 仿 真实 验 结 表 1 地 铁 环境 中 的 对 象 分 类 表 

果 证 明了 该 方法 的 高 效 性 。 
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对 象 特征 
对 象形 态 
1 ”多 依赖 事件 微观 中 观 宏观 
1.1 事件 的 依赖 关系 环境 对 象 温度 、 湿 度 、 粉 尘 等 单 环境 影响 ， 地 理 影 响 
二 vv ba 项 | RR 
人 人 全 检测 的 对 象 , 是 复杂 事件 检测 的 基本 组 AAA Wo 
事件 作为 复杂 事件 检测 的 对 象 ， 杂事 件 检 测 的 基本 经 感 器 上 电压 、 
ee ne ss wae 列车 人群 等 单个 参数 列车 运行 乘客 行为 
CN 本 AU 从 人 移动 天 象 BE 流 等 数据 的 变 的 变化 等 综合 因素 
述 事件 间 的 关系 才能 实现 复杂 事件 检测 。 基 于 此 本 文 将 事件 间 0 
立 覆 、 形 和 八 寺 里 个 参 
的 依赖 关系 分 为 两 类 ， 分 类 关系 和 非 分 类 关系 ， 并 给 出 事件 间 5 固定 对 象 二 化 项 访 等 全国 
的 关系 定义 如 下 — 
中 国定 对 象 指 其 位 置 不 随时 间 的 变化 而 变化 的 感知 对 象 ， 


定义 1 分 类 关系 。 假 如 有 事件 类 EC 1 和 EC 2, 且 EC 1 
和 EC 2 间 有 分 类 关系 , 如 果 EC_2cEC_1, 我 们 称 EC1 为 上 位 事 
件 类 ，EC2 为 下 位 事件 类 。 

定义 2 非 分 类 关系 。 
要 类 型 ; 

a) 复合 关系 。 如 果 复 合 事件 e 可 以 分 解 为 多 个 子 事件 e 
(i> 0) ， 当 这 些 子 事件 完成 时 ， 表 示 复 合 事件 e 完成 ， 则 复 
合 事件 e。 和 子 事件 e; (i> 0) 之 间 存 在 复合 关系 。 如 果 事 件 类 
ECl 的 每 个 事件 实例 都 是 由 事件 类 EC2 的 实例 和 其 他 事件 类 的 
事件 实例 构成 ， 即 EC1 由 EC2 组 成 ， 记 为 EC_2<EC 1。 

b) 因果 关系 。 如 果 事 件 类 EC1 的 事件 实例 发 生 ， 事 件 类 
EC2 的 事件 实例 在 指定 的 概率 阔 值 以 上 有 可 能 发 生 ， 则 事件 类 
EC1 与 事件 类 EC2 间 存 在 因果 关系 。 即 EC1 是 原因 事件 类 ，EC2 
是 结果 事件 类 ， 记 为 EC_1 一 EC 2。 

c) 连接 关系 。 如 果 在 一 定 的 时 间 内 , 事件 类 EC1 和 EC2 的 ”2 基于 事件 树 的 事件 划分 方法 
有 件 实例 按照 先后 时 间 顺 序 产生 ，EC2 作为 EC1 逻辑 运行 的 结 
果 ， 则 事件 类 EC1 与 EC2 存在 连接 关系 。 即 EC1 连接 EC2， 记 
为 EC_ 25EC 1。 

d) 伴随 关系 。 如 果 在 一 定 的 时 间 内 ， 事 件 类 EC1 与 事件 
类 EC2 同时 发 生 ， 且 发 生 的 概率 高 于 某 规定 的 概率 值 ， 则 事件 
类 EC1 与 EC2 间 存 在 伴随 关系 。 即 EC1 伴随 于 EC2， 记 为 EC 2 
/EC 1。 
其 中 分 类 关系 ， 反 映 的 事件 间 的 静态 特征 关系 ， 指 异 构 奸 


包括 隧道 ， 轨 道 及 站 台 建 筑 等 ， 移 动 对 象 指 随 着 时 间 变 化 而 不 
断 变化 的 感知 对 象 ， 包 括 机 车 ， 乘 客 等 。 不 同 的 感知 对 象 间 产 
生 的 感知 事件 虽然 由 不 同 对 象 产生 ， 但 参照 定义 1 和 2 将 其 之 
间 的 关联 性 分 为 : 

a) 空间 关联 性 。 运 行 环境 中 的 参与 个 体 具 有 相对 的 空间 
变化 。 如 列车 在 高 速 通过 某 空 间 时 ， 其 运行 速度 直接 影响 路 基 
的 沉降 大 小 。 

b) 时 间 关 联 性 。 运 行 环境 中 的 参与 个 体 随 时 间 的 变化 而 
产生 变化 。 如 在 固定 上 下 班 高 峰 时 段 ， 站 台 的 人 流量 是 会 有 增 
加 。 


由 


了 件 的 非 分 类 关系 包括 以 下 四 种 主 


山 岂 


帆 | 


c) 不 确定 关联 性 。 运 行 的 环境 会 因 诸多 不 确定 的 因素 产 
生变 化 。 如 突 发 事件 ， 随 机 干扰 和 主观 影响 等 不 确定 的 因素 造 
成 的 影响 。 


本 性 


前 文 已 经 说 明 ， 面 对 多 源 海量 的 实时 事件 流 ， 传 统 的 CEP 
以 集中 处 理 方式 无 法 及 时 处 理 ， 不 考虑 事件 间 关 系 的 分 流 方法 
同样 效率 较 低 。 所 以 根据 事件 间 的 依赖 关系 将 事件 流 划分 到 不 
同 CEP 引擎 处 理 ， 是 提升 复杂 事件 检测 效率 的 有 效 方法 。 如 何 
将 海量 实时 的 原始 事件 流 快速 、 高 效 地 划分 为 多 条 内 含 多 依赖 
关系 的 事件 流 是 实现 基于 事件 树 的 事件 划分 方法 的 关键 。 

利用 树 结构 的 深度 ， 高度， 子 树 及 根 叶 节 点 的 变化 可 以 更 
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好 的 处 理 
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用 稿 


原始 事件 流动 态 实时 感知 的 特性 ， 如 Left Deep 
时，Tree-NFA"”"，CPI-Tree“ 等 。 因 此 我 们 以 事件 树 的 结 
构 为 基础 进行 事件 


分 流 ， 依 照 上 文中 提 到 的 事件 间 依 赖 关系 ， 


之 间 不 同类 别 的 分 类 关系 及 深层 的 语义 关系 ， 同 时 虑 
事件 优先 级 和 层次 结构 ， 提 出 一 种 解决 事件 间 依 赖 性 的 复杂 事 


定义 事件 
件 分 流 方法 。 
2.1 算法 思想 及 实现 


性 ， 


1) 算法 思想 


在 事件 的 分 流 过 程 中 ， 考 虑 事件 间 的 依赖 


将 存在 相互 依赖 的 事件 分 流 到 同一 个 CEP 引擎 中 处 理 ， 相 


CEP 引擎 的 检 涡 
种 类 的 优先 
要 性 。 


比 于 不 考虑 事件 依赖 关系 , 按照 集中 顺序 固定 分 割 的 分 流 方法 ， 
| 效率 会 有 提升 。 在 分 流 的 过 程 中 考虑 不 同 
级 ， 优 先 级 高 的 事件 对 于 得 到 复合 事件 有 较 高 的 重 


2) 算法 步骤 


六 


事件 


a) 根 据 用 户 需 求 的 对 应 业务 进行 优先 级 划分 , 其 中 要 求 处 


里 时 间 短 的 业务 对 应 的 优先 级 越 高 。 


b) 参 照 a) 中 定义 的 优先 级 ， 在 事件 的 有 效 长 度 窗 口内 遍 
历 构 造 事件 树 。 


(a) 以 不 同 种 类 的 事件 为 叶子 节点 ， 并 为 每 个 叶子 节点 
标注 其 事件 的 对 应 优先 级 值 ， 先 给 出 一 个 空 的 根 节点 。 
(b) 循环 比较 (a) 中 构造 的 每 个 事件 树 结构 叶子 节点 的 


图 1 所 示 。 


EE 


关 
处 


et 
| 


烛 


高 优先 级 值 ， 并 将 最 大 的 优先 级 值 赋值 给 当前 树 的 根 节 点 。 


可 F 件 1sc2 
高 优先 级 


于 作 1 天 件 2 
低 优先 级 高 优先 级 


图 1 事件 树 结构 


(c) 在 事件 的 有 效 长 度 窗口 内 按照 上 述 方式 生成 所 有 的 


有 件 树 。 


c) 遍历 b) 中 生成 的 事件 树 ， 记 录 每 个 子 树 根 节点 的 优先 
级 值 ， 按 照 定义 1、2 记录 节点 事件 间 的 依赖 关系 ,将 存在 依赖 
系 的 事件 树 存放 到 一 个 待 处 理 队 列 中 ， 等 待 CEP 引擎 的 请 求 


理 。 


3) 算法 实现 


专 件 分 流 的 基 而 


在 上 述 的 算法 步骤 中 ， 依 赖 事 件 树 的 生成 较为 重要 ， 是 实 
,其 中 事件 树 生成 算法 伪 代 码 如 算法 1 所 示 。 


Algorithm1. Event Tree Generation Algorithm 


Input: 1 sequence of events collected by the sensor (include n events); 


2 defines the size of the event tree (here scale) 


1: new Tree tree = {}; 
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2: define priority for collecting events according application 
requirements 


3: fori=1;i<=n;i++ 


4: put the ith event as a leaf node to the tree 

S: if the priority of the ith event > root node priority 

6: the root node priority value = the priority value of the ith 
event 

人 endif 

8: else 

9: if the number of leaf nodes = scale; 

10: out the current structure of the completed event tree 
11: new Tree tree = {}; 

12: end 

13: end 


Output. the generated event tree 

其 中 scale 的 值 取 决 于 CEP 引擎 的 处 理性 能 。 根据 输入 的 
事件 序列 ， 循 环 构造 多 个 事件 树 ， 我 们 使 用 hashmap 的 方式 实 
事件 树 的 存储 ， 可 以 节省 海量 数据 的 插入 、 查 找 时 间 。 这 些 
生成 的 事件 树 之 间 是 存在 依赖 关系 的 ， 因 此 需要 将 有 依赖 关系 
的 事件 树 推送 到 一 个 CEP 引擎 中 ， 所 以 将 依赖 的 事件 树 存放 在 
一 个 事件 树 链 表 中 ， 依 赖 事件 树 链表 生成 算法 伪 代 码 如 算法 2 


Algorithm2. Event Tree Generation Algorithm 


Input: m event trees generated by the sequence of events 


1: new List list = {}; 


2: fori=1;i<=m;i++ 


3 for j = 计 1; j<=my; j++; 

4: if the ith tree has the same children as the jth tree 
0 put the jth tree in the same list as the ith tree; 
6: remove the jth tree; 

人 endif 

8: else 

9: new List list = {}; 

10: put the jth in the new list; 

11: end 

12: end 


Output. the generated event tree list 

算法 2 中 虽然 存在 双重 的 for 循环 ， 但 是 在 判断 过 程 中 
如 果 存 在 一 个 相同 的 原子 事件 节点 ， 我 们 就 将 整 棵 事件 树 添加 
到 list 中 , 然后 从 集合 中 移 除 该 事件 树 , 所 以 这 个 循环 过 程 是 
对 比 量 不 断 减少 的 过 程 ， 对 事件 的 分 流 效率 影响 不 大 。 
2.2 ”事件 分 流 引 擎 架构 

本 文采 用 的 事件 分 流 引 擎 架构 如 图 2 所 示 。 在 本 文 所 研究 
的 地 铁 列车 环境 中 ， 其 产生 的 事件 是 多 种 多 样 的 ， 包 括 传感器 
或 RFID 产生 的 数据 流 ，GPS 位 置信 息 ， 天 气 信息 等 等 。 我 们 把 
这 些 多 种 类 的 事件 合 在 一 起 成 为 事件 云 。 该 架构 主要 包括 事件 
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云 ， 事 件 流 


划分 器 ，CEP 引 


分 是 本 文 算法 的 主要 体现 。 


事件 


擎 集群 等 ， 其 中 主要 事件 划分 器 部 


图 2 事件 分 流 引擎 架构 


划分 器 负责 对 事件 云 中 的 实时 


的 分 流 处 理 。 


在 图 


山 届 


起 


起 


出 中 


世 


滑动 窗 
的 CEP 号 


NN 


可 


3 


牛 云 中 构造 事 
牛 树 中 包含 如 定义 1,，2 
加 到 同一 个 事 
则 将 该 事件 


擎 处 到 


实验 分 析 与 案例 研究 


牛 树 ， 遍 历 事件 树 
的 
牛 树 链表 中 
树 添 加 到 新 的 事件 树 
内 的 事件 构造 完毕 后 ， 
E， 最 终 输 出 查询 


多 


Ey 


» 如 


2 中 


区 


链表 ， 如 


士 四 
结果 。 


2 中 Tree-ao。 


数据 流 进 行 依赖 关系 


划 


雅 正 ， 


平均 匹配 效率 指 的 是 处 


等 : 地 铁 列 车 


消耗 越 小 意 


球 着 有 更 高 的 响 


种 算法 的 响 
使 用 事 
时 ,算法 3 


YH 时 | 则 


向 应 时 | 


应 性 


Chi 
中 多 依赖 


每 个 输入 
能 。 如 图 


in&Xiy 会 作 捧 
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事件 的 时 间 消 耗 ， 时 间 


区 分 不 大 ,但 在 输 


3, 在 单 事件 流下 ,三 
入 事件 流 种 类 数 超过 3 时 ， 


件 树 分 流 的 算法 3 有 更 


在 依赖 关系 
同 的 依赖 事 


优 的 匹配 效率 ; 
间 明 显 优 于 算法 1、 
行事 件 分 流 时 ， 充 分 考虑 原子 事件 间 
原子 事件 构成 事件 树 为 节点 构造 事 
牛 树 链 表 分 配 到 不 同 CEP 引擎 ， 减 少 不 相 关 事件 的 


当 种 类 数 变 为 6 
2。 这 是 因为 算法 3 在 进 
存在 的 多 依赖 关系 ， 以 存 
和 牛 树 链表 ， 将 不 


元 余 检 测 和 计算 ， 因 而 节省 了 检测 时 间 。 


900 


重 -” 算法 I 


图 算法 2 
加 -算法 3 


响应 时 间 (总 秒 ) 
EE 


2 中 ， 当 查询 操作 发 生 ， 根 据 算 法 1 从 原始 
中 的 叶子 节点 事件 ， 若 两 棵 
依赖 关系 ,， 则 按照 算法 2 将 两 棵 树 
的 Tree-b 与 Tree-c; 


a 


将 这 些 事件 树 链 表 分 配给 不 


本 文选 择 以 Java 开发 的 复杂 事件 处 理 引 敬 Esper，Esper 
可 以 结合 多 种 数据 源 的 数据 对 信息 流 进行 监测 、 分 析 从 推理 出 
一 些 复杂 的 事件 或 模式 。 数 据 源 以 广州 地 铁 2015 年 3 号 线 
夏 演 车 辆 段 的 运行 时 无 线 传 感 网 检测 数据 为 事件 源 ， 事 件 输入 
流 类 型 包括 温度 事件 流 ， 湿 度 事 件 流 ， 光 照 事 件 流 ， 粉 尘 事件 
流 ， 电 压 事件 流 等 6 种。 
3.1 实验 分 析 

实验 的 环境 为 在 实验 室 条 件 下 搭建 的 3 个 节点 的 集群 环 


流 


Intel Xeon E5-2650 


， 每 个 节点 的 操作 系统 为 Centos7.2，Java 版 本 为 JDK 
1.8.0_ 91 , 每 个 节点 配置 为 CPU 


2.6 GHz， 


内 存 20 GB, 在 每 个 节点 上 搭建 Esper 处 理 引 擎 为 6. 1. 0。 本 次 


实验 的 事件 基数 为 10000， 滑 动 窗 


为 了 验证 
时 性 ， 实 验 主 要 对 上 


基于 事 


查询 处 理 


a 


完 广 法 。 


件 树 的 多 依赖 事件 
k Schultz-Moller 冬 
的 方法 "、Chen 等 人 的 基于 
和 本 文 提出 的 方法 在 平均 匹配 效率 、 事 件 处 到 
空间 三 个 指标 上 的 优势 。 为 方 
Schultz-Moller 等 人 的 方法 ， 
算法 3 表示 本 文 看 


口 大 小 为 100。。 


等 人 的 多 个 节 


操作 和 


划分 方法 的 高 效 性 和 


夺 的 事件 分 流 方 法 吕 


实 
六 点 上 分 配 


在 吐 


量 及 内 存 占 


面 起见 ， 下 文中 的 算法 1 表示 
算法 2 表示 Chen 等 人 的 方法 ， 


更 大 的 事件 吞 中 


输入 明和 忻 流 种 类 ( 于 件 流 流 吉 为 2*10+ 玫 件数 / 秒 ) 


图 3 不 同 输入 事件 种 类 下 的 算法 匹配 率 对 比 


里 香 吐 量 反映 系统 在 单位 时 间 内 能 处 理 的 事件 规 


模 ， 以 


每 秒 钟 处 理 的 事件 数量 来 量化 表示 。 


型 的 混合 事件 流 , 在 相同 输 


算法 3 的 事件 处 理 


3 将 原子 事件 通 


应 


入 规模 下 ， 算 法 3 相 比 算法 1、2 有 
FE 处 理 能 力 。 在 较 大 的 输入 流 


吞吐 量 约 比 算法 1、2 高 


如 图 4， 输 入 采用 六 种 类 


(8*10 ) 环境 下 ， 
这 是 因为 算 


> 


出 30%。 


过 事件 间 的 依赖 关系 进行 连接 ， 减 少 低 价值 


云 


烛 


种 件 检测 天 
能 力 , 增 加 了 事件 


对 系统 计算 资源 造成 的 
处 理 的 否 


处 理 节 点 


不 


理 吐 最 ( 种 件 / 秒 ) 


算法 运行 时 的 内 存 占 
的 测 i 


5 所 示 ， 在 相同 
存 空间 大 


pie 


肖 耗 ， 从 


提高 了 系统 的 处 理 


帆 | 导 
下 


F 吐 量 。 


晶 是 随 着 


件 规模 不 断 增 大 ， 


间 的 通信 也 消耗 了 一 定 资源 ， 
能 随 着 事件 规模 的 增 大 而 无 限 提升 。 


一 各 一 
一 全 一 
i 


闻 件 流 天 小 
图 4 三 种 算法 吞吐 量 对 比 


人 
\ 更 优 于 算法 1、2， 究 其 原因 是 在 对 


行事 件 树 链表 的 构造 过 程 中 ,存在 依 
i 少量 不 存在 依赖 关系 的 原子 导 


有 件 被 过 滤 掉 ， 


BB 


此 事件 处 理 吞 吐 量 


算法 1 
算法 2 
算法 3 


101 


CA 
的 
原子 事件 流 进 
牛 被 加 入 链表 ， 
此 省 了 内 存 的 


赖 关 系 的 事 
天 
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肉 存 占 用 空间 


3.2 ”案例 研究 
地 铁 作为 城 


工具 之 


总 
入 


轨道 交通 的 一 
， 为 了 增强 地 铁 运 行 时 


运营 环境 有 较 全 面 的 实时 把 


的 安全 性 


图 5 三 种 算法 内 存 占用 空间 对 比 


运 
断 。 但 由 于 地 铁 运行 环境 的 特殊 性 
以 多 采用 无 线 传感器 网 检测 


为 例 ， 其 在 地 铁 隧道 中 部 署 温度 传感器 、 


, 已 经 成 为 很 多 人 最 主要 的 
， 和 需要 对 
尼 ， 才 能 在 关键 时 刻 做 出 正 
E 线 传 感 网 的 便 
上 地 铁 的 运行 时 数据 ” 。 


上 


也 铁 的 
确 的 坟 
利 性 ,月 
以 广州 地 
湿度 传感器 、 速 度 传 


感 器 、 电 压 传 感 器 等 等 。 

以 广州 地 铁 为 例 ， 列 好 虑 的 忆 素 为 车 门 停 
靠 位 置 需要 对 齐 屏蔽 门 ， 这 样 便 乘 车 。 所 以 在 列 
车 进 站 前 ， 需 要 考量 关于 列 运行 车 及 环境 的 实时 数据 包括 : 列 
车 的 实时 速度 ， WA 与 对 应 屏蔽 门 的 
距离 等 等 。 此 外 ， 温 度 ， 湿 度 等 这 些 辅 助 中 也 是 需要 考 
虑 的 ， 在 不 同 的 温 湿度 情况 下 ， 导 轨 的 B 力 是 不 同 的 ， 进而 影 
响 列 车 的 速度 ， 加 速度 等 关键 因素 。 所 以 如 何在 复杂 的 列车 运 
行 环 境 中 处 理 存在 依赖 关系 的 实时 数据 流 ， 实 现 对 列车 日 常 运 
行 状况 的 实时 监控 ， 甚 至 在 列车 遇 到 突 发 紧急 情况 时 ， 能 快速 
故 出 的 响应 是 广州 地 铁人 迫切 需要 的 问题 。 

依据 基于 事件 树 的 事 伯 去 的 思想 

a) 根据 地 铁 进 站 时 实际 运行 环境 中 传感器 节点 的 种 类 , 结 
合 业 务 的 需求 依次 赋予 传感器 检测 事件 的 优先 级 如 表 2 所 示 。 

表 2 地 铁 检测 事件 优先 级 分 类 表 
事件 名 称 事件 ID 优先 级 类 型 优先 级 值 

加 速度 ACCE 要 事件 3 

速度 SPEE 要 事件 3 

距离 DIST 事件 3 

温度 TEMP 事件 

湿度 HUMI 要 事件 3 

关键 加 速度 CACC 全 

关键 速度 CSPE 和 4 
关键 距离 CDIS 和 4 
平均 加 速度 AACC 事件 1 
平均 速度 ASPE 事件 1 
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平均 距离 非 关键 事件 1 
入 站 正常 事件 2 
出 站 正常 事件 2 
表 2 描述 水 、 事 件 ID、 优 先 级 种 类 和 赋予 的 优先 
级 值 。 其 中 主要 事件 指 传感器 实时 发 回 的 检测 事件 ;关键 事件 
间 某 一 特殊 时 刻 时 传感器 检测 到 事件 ， 事 件 产生 的 影响 十 分 明 
确 。 
b) 在 事件 的 有 效 长 度 窗口 内 , 参照 表 2 的 事件 优先 级 构造 


以 复杂 事件 为 根 节点 的 习 


牛 树 。 如 图 6 所 示 


其 中 A,B,… Y， 


4 


3 3 2 3 对 3 4 
a b C 


如 图 6 所 示 ， 事 件 


为 B， 


了 ™ 


烛 


速度 具有 的 优 


c) 由 于 上 拒 


节点 ; 事件 树 b 表示 
进 站 ， 其 中 速度 与 加 速度 的 优 
事件 树 c 表示 速度 X 以 关键 减速 加 速度 为 U 减速， 其 


图 6 列车 进 站 时 对 应 的 事件 树 
树 a 表示 环境 中 此 时 的 温 
i 先 级 相同 ， 所 以 将 两 者 的 任意 优先 级 值 传 给 根 


度 为 A， 湿 度 


叶 节 点 的 事件 


亿 先 级 值 。 


d) 在 c) 构造 的 事件 


擎 请 求 处 理 该 链表 中 的 事 们 


树 链表 里 的 所 有 事 作 


n 


各 其 优先 级 值 传 给 根 节 ， 
4 事件 树 p 与 事件 树 c 者 
树 ， 所 以 将 这 两 个 存在 依赖 的 事 

事件 树 链表 中 。 其 中 链表 中 的 索引 值 为 每 个 事件 树 中 根 节 点 的 


全 


点 。 


F 时 ， 则 将 该 事件 


如 图 7 所 示 。 


如 图 7 所 示 ， 
ENTE 事件 被 触发 ，CEP 引擎 开 
件 SPEE， 加 速度 导 


A A 


7 列车 进 站 时 对 应 的 事件 树 分 流 


当 列 车 进 站 时 ， 复 杂事 件 检 


始 处 理 以 入 站 导 


乔 件 ACEE 构成 的 b 事件 树 ， 


以 


1 车 以 速度 为 Xx， 减速 加 速度 为 Y 的 速度 
先 级 值 高 ， 将 该 值 传 给 根 节点 ; 
pb 关键 加 


Bb 包含 以 速度 为 
牛 树 存放 在 一 个 


树 链表 的 基础 上 ， 当 任何 一 个 CEP 引 
F 树 的 叶子 节点 事 伯 
E 送 给 该 CEP 引擎 处 理 。 


则 模块 检测 到 
大 件 ENTE， 速 度 事 
期 得 到 复杂 事 


习 
+ 


录用 稿 


件 ESAC; 同时 CEP 引擎 也 要 处 理 速 度 事件 SPEE 和 关键 加 速度 
有 件 CACC 构成 的 c 事件 树 以 得 到 复杂 事件 SPCA， 但 因为 在 该 


Nhl 
‘0 
山中 


时 间 窗 口内 同时 存在 以 速度 事件 SPEE 相同 为 叶子 节点 的 事件 
树 b 与 事件 树 c， 所 以 只 有 将 事件 树 b 和 c 放 在 同一 个 CEP 引 
擎 中 处 理 ， 才 能 得 到 整个 过 程 中 产生 的 复杂 事件 。 


综 上 所 述 , 该 复杂 事件 数据 流 最 终 描 述 的 是 地 铁 列车 在 温 
度 为 A， 湿度 为 B 的 环境 下 ， 原 本 以 X 速度 ， 减 速 加 速度 为 了 
进 站 ， 进 站 后 发 现 速度 过 高 ， 开 始 调整 关键 减速 加 速度 为 U， 
以 适应 列车 的 停靠 。 


4 结束语 


本 文 着 重 研 究 针 对 实时 数据 复杂 事件 检测 中 的 事件 负载 分 
流 问 题 ， 提 出 了 一 种 基于 事件 树 的 多 依赖 复杂 事件 检测 方法 。 
该 方法 继承 了 基于 树 型 结构 的 复杂 事件 检测 的 高 效 性 ， 并 进 
步 给 出 异 构 事 件 源 之 间 多 依赖 关系 的 明确 定义 ， 使 用 一 种 依赖 
事件 树 链 的 方法 对 海量 原始 数据 流 进行 分 流 处 理 ， 提 高 了 复杂 
事件 检测 效率 和 事件 吞吐 量 。 案 例 研究 说 明了 该 方法 在 地 铁 列 
车 运行 环境 中 的 可 行 性 。 

针对 具体 的 应 用 场景 ， 对 于 该 方法 在 实际 应 用 过 程 中 遇 到 
的 新 的 特点 ， 有 待 进一步 深入 研究 。 
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